载 瓦 语 声 调 的 声学 及 感知 研究 * 
kise 和 孔 江 平 
[提要 ] 本 文采 用 声学 和 感知 的 方法 ， 对 载 瓦 语 的 声调 调 值 进 行 了 研究 ， 声 学 分 析 表 明 载 瓦 语 
中 存在 2 个 平 调 、3 个 降 调 和 1 个 升 调 。 调 值 分 别 是 : 55, 44, 35, 51, 31 21。 在 声学 分 析 的 
基础 上 ， 本 文选 取 了 三 种 声调 和 发 声 的 组 合 类 型 进行 了 感知 研究 。 这 三 种 分 别 是 : D 声调 
不 同 ， 元 音 同 为 正常 嗓音 ; 2) 声调 不 同 ， 元 音 同 为 紧 嗓 音 ; 3) 声调 不 同 ， 元 音 发 声 类 型 不 
同 。 声 学 分 析 和 感知 研究 发 现 ， 基 频 和 发 声 类 型 对 载 瓦 语 的 声调 感知 都 有 贡献 ， 都 具有 语言 
学 意义 ， 当 发 声 类 型 缺失 时 ， 被 试 出 现 “ 基 频 感 知 中 立 ”。 
[关键 词 ] 载 瓦 语 发 声 类 型 声学 分 析 声调 感知 
= Bm 
语音 感知 研究 对 研究 人 类 语言 音 位 的 心理 实体 和 确立 音 位 的 范畴 非常 习 
年 代 ， 声 调 的 感知 研究 开始 得 到 语言 学 界 的 普遍 重视 。 虽 然 不 能 够 把 基 频 与 声调 完全 等 同 ， 
= 但 是 学 界 普 遍 认 为 , 声调 的 高 低 升降 曲直 主要 是 由 基 频 的 变化 所 决定 的 , 所 以 对 于 声调 的 感 
知 研究 ， 目 前 基本 上 是 通过 改变 基 频 的 高 低 来 进行 听 辨 实验 。 
EEJ (Wang, 1976) 以 /i/ 为 负载 音节 ， 通 过 改变 基 频 ， 合 成 了 普通 话 阴平 -阳平 的 
11 个 刺激 连续 体 。 识 别 实验 和 区 分 实验 结果 显示 ， 母 语 者 对 于 普通 话 〈 北 京 话 ) 阴平 -阳平 
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的 感知 是 范畴 感知 (Categorical perception). Abramson (1977) 通过 哈 斯 金 斯 实验 室 的 
parallel-resonance 合成 器 改变 基 频 ， 合 成 了 中 央 泰 语 中 跨越 高 平 、 中 平 、 低 平 三 个 平 调 
的 8 个 刺激 连续 体 ， 对 33 名 母语 者 进行 了 感知 实验 ， 结 果 发 现 ， 母 语 者 对 声调 的 感知 是 连 
J 能 
HF Wang (1976) 的 实验 中 刺激 是 从 平 调 到 升 调 的 连续 体 ， 而 在 他 的 实验 中 ， 三 个 声调 均 是 
平 调 。Abramson( 1977) 认为 泰语 除了 这 三 个 平 调 ， 还 有 一 个 升 调和 一 个 降 调 ， 那 么 ， 如 果 
对 中 央 泰 语 从 升 调 到 降 调 的 刺激 连续 体 再 进行 区 分 实验 , 或 许 能 够 解释 这 两 个 实验 结果 的 差 
异 。 此 外 ，Abramson 还 认为 ，Wang (1976) 的 实验 中 声调 所 负载 的 音节 仅仅 是 单元 音 /i/， 而 
他 的 实验 中 声调 负载 的 音节 是 相对 复杂 的 /kha:/, 这 可 能 也 会 导致 实验 结果 的 差异 。Francis et 
al. (2003) 进一步 对 这 些 实验 结果 进行 了 解释 ， 他 认为 Wang (1976) 使 用 的 声调 同时 包含 调 


型 (pitch contour) 和 音 高 (pitch heighb 的 变化 , 而 Abramson 使 用 的 泰语 声调 只 包含 音 高 的 变化 ， 
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续 感 知 (Continuous Perception). Abramson 认为 ， 与 Wang (1976) 结果 不 同 的 原因 
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这 可 能 是 导致 两 者 结果 有 差异 的 原因 。 于 是 ， 他 同时 考察 了 母语 者 对 粤语 中 三 个 平 调 之 间 、 
平 调 与 曲 拱 调 之 间 以 及 曲 拱 调 之 间 的 感知 情况 。 实 验 结果 显示 ,粤语 三 平 调 的 感知 结果 与 中 
央 泰 语 平 调 的 感知 结果 相似 ,是 连续 感知 ,而 粤语 平 调 与 曲 拱 调 的 感知 结果 是 范畴 感知 ,与 


Wang (1976) 的 感知 结果 相同 。Francis 的 研究 结果 证 明了 声调 调 型 的 变化 对 范畴 感知 的 
重要 性 ， 也 有 不 少 其 他 学 者 的 研究 同样 证 明了 这 一 点 ， 即 : 母语 者 对 于 调 型 相同 的 声调 感知 


往往 是 范畴 感知 ， 如 普通 话 的 平 调 与 升 调 之 间 、 平 调 与 降 调 之 间 ， 升 调 与 降 调 之 间 。 但 


这 个 规律 是 否 适用 于 所 有 的 声调 语言 ， 目 前 尚 待 继续 研究 。 


往往 是 连续 感知 ， 如 平 调 之 间 、 升 调 之 间 ， 而 对 调 型 不 同 尤 其 是 方向 完全 相反 的 声调 的 感知 
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近年 来 ， 随 着 声学 、 生 理学 和 心理 学 研究 的 进展 ， 学 界 已 
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到 仅仅 依靠 基 频 不 能 够 


准确 描写 声调 , 也 不 能 完全 对 声调 的 感知 结果 做 出 解释 , 尤其 是 当 该 语言 中 同时 存在 特殊 发 
声 类 型 时 。 如 张 锐 锋 、 孔 江平 《2014) 发 现 , 河南 各 州 话 方言 声调 的 感知 中 ， 发 声 类 型 也 起 


到 了 一 定 的 作用 , 在 基 频 差别 大 的 情况 下 发 声 类 型 对 感知 的 贡献 较 小 , 在 基 频 差别 小 的 情况 
下 ， 发 声 类 型 在 感知 上 的 贡献 就 会 变 大 。 刘 文 、 张 锐 锋 (2016) 发 现 , HIRE 


22) 和 低 降 调 CT6: 31) 的 区 分 是 发 声 和 基 频 二 者 共同 作用 


语 低 平 调 (T5: 


性 特征 ”到 底 是 什么 ”这 些 问题 仍 需 做 深入 研究 。 
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因此 , 本 文选 取 了 声调 系统 中 同时 具有 基 频 和 发 声 类 型 对 立 的 载 瓦 语 作 为 研究 对 象 , 首 


先 , 通过 声学 分 析 确 定 其 调 值 及 发 声 类 型 。 其 次 , 从 中 选取 “声调 不 同 , 元 音 同 为 正常 嗓音 ”; 


“声调 不 同 ， 元 音 同 为 紧 嗓音 ”; “声调 不 同 ,元 音 发 声 类 型 不 同 ” 这 三 种 类 型 声 i 


中 国境 内 的 一 些 少数 民族 语言 中 , 声调 之 间 不 仅 存在 基 频 的 对 立 , 还 同时 还 存在 发 声 类 
型 的 对 立 ， 那么 ,母语 者 感知 的 结果 是 基 频 起 了 作用 还 是 发 声 类 型 起 了 作用 ? 


5l 


HARE H 


组 合 进行 感知 实验 研究 ,以 期 探讨 基 频 和 发 声 类 型 对 于 母语 者 感知 的 贡献 。 实验 结果 对 于 载 


瓦 语 声调 音 位 范畴 的 讨论 与 区 分 将 具有 重要 的 理论 意义 。 


二 、 载 瓦 语 声调 的 声学 分 析 


载 瓦 语 是 中 国 景 颇 族 中 自称 “ 载 瓦 ”的 人 使 用 的 语言 ， 忆 
当地 人 称 “ 小 山 话 ” 根据 《 载 瓦 语 语言 简 志 》( 徐 悉 艰 、 徐 桂 珍 ，1984)， 载 瓦 语 声调 
3 个 : 21 (也 有 学 者 认为 是 22)，55，51。 此 外 ， 正 常 嗓音 
嗓音 韵母 只 能 同 不 送气 音 、 浊 探 音 、 鼻 音 、 边 音 结 合 。 当 声母 是 不 送气 音 〈 清 探 音 除 外 ) 和 
韵母 是 正常 嗓音 时 ，55 调 的 实际 调 值 是 15〈 也 有 学 者 认为 是 35)( 何 勒 腊 , 2016)。 根 据 是 
否 带 塞 尾 ，21 调和 55 调 有 促 声 调和 舒 声调 之 分 。 此 外 ， 戴 庆 厦 〈1989) 通过 载 瓦 ; 


阿 昌 、 哈 尼 等 亲属 语 之 间 的 比较 ， 详 细 论 证 了 载 瓦 语 声调 的 来 源 和 分 化 问题 ， 


Ds 


于 汉 藏 语系 藏 缅 语 族 缅 语文 ， 
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韵母 能 同 所 有 的 声母 结合 ，T 


ES 


chinaXiv:201811.00126v1 


瓦 语 声调 的 归 类 有 两 种 方法 : 一 种 是 现在 这 种 分 类 法 ， 主 要 根据 调 值 的 相近 程度 ， 把 舒 声调 
和 促 声 调 合 为 一 类 。 这 样 分 的 结果 , 在 55. 21 两 个 调 里 既 有 舒 声 调 ， 又 有 促 声 调 。 另 一 种 
方法 是 把 舒 声调 和 促 声 调 分 开 ， 归 为 五 个 调 ，3 个 舒 声调 和 2 个 促 声 调 。 他 指出 ， 从 声调 的 
变化 上 看 ， 分 为 三 个 调 比较 方便 ， 但 如 果 为 了 研究 载 瓦 语 声调 的 发 展 变化 ,似乎 把 舒 声调 和 
促 声调 分 开 分 析 更 方便 些 。 但 前 人 对 载 瓦 语 的 声调 研究 多 是 依靠 田野 调查 的 听 音 、 记 音 , 未 


曾 有 人 进行 过 声学 分 析 。 


为 更 准确 厘清 载 瓦 语 的 声调 情况 , 本 文选 择 了 4 名 来 自 德 宏 傣族 景颇 族 自 治 州 瑞丽 市 户 


育 乡 的 村 民 作为 发 音 人 采集 数据 。 其 中 2 iet 
4420, 一 名 36 岁 。 他 们 的 母语 均 是 载 瓦 语 ， 会 说 普通 话 。 根 据 得 到 的 语音 样本 ， 提 取 男 


E， 一 名 19 岁 ， 


一 名 48 岁 ; 2 名 男性 ， 一 


女 发 音 人 的 基 频 数据 作 平 均值 。 此 外 ， 目 前 国际 上 的 声调 和 音调 的 研究 都 采用 半音 法 〈 刘 复 


1924; 孔 江 平 2015:64-65). 相对 于 纯 物 理 声学 参数 的 基 频 而 言 , 半音 值 比 较 符 合 人 的 听 感 ， 


因为 半音 之 间 的 关系 反映 的 是 听 感 上 的 关系 。 


因此 ， 本 文采 用 


半音 法 将 基 频 转换 为 半音 值 ， 


半音 =12 x log2(fx/f2)， 其 中 f2 为 调 域内 的 最 低 值 ，fx 为 每 一 点 的 实测 基 频 值 ， 当 fx 取 调 
域内 最 高 值 时 得 出 的 半音 即 为 该 发 音 人 的 音域 , 本 文中 调 域内 基 频 最 高 值 为 248Hz， 最 低 值 
为 146Hz, 计算 得 出 音域 约 为 9 个 半音 。 得 到 半音 值 之 后 ,再 将 其 转换 为 5 度 值 ,5 BER [ügfx 


-lgf2)/(lgf1-lgf2)x 4] +1。 最 后 得 出 载 瓦 语 声调 基 频 及 五 度 值 情况 如 图 1 所 示 。 
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图 1: 载 瓦 语 声 调 基 频 和 五 度 值 图 
从 图 1 中 可 以 看 出 ， 基 频 分 析 的 结果 与 传统 记 音 有 较 大 差异 ， 主 要 体现 在 以 下 2 点 : 


首先 是 舒 声调 与 促 声 调 的 调 值 有 较 大 差异 , 载 瓦 语 的 促 声 调 55 明显 比 舒 声调 55 的 基 频 
要 高 1 度 左右 ， 促 声调 约 为 55， 而 舒 声调 约 为 44。21 调 同 理 ， 促 声调 约 为 31， 舒 声调 约 为 
21。 男 外 ， 由 于 这 两 个 调 的 时 长 差别 太 大 ， 因 此 ， 本 文 认 为 将 舒 声调 与 促 声 调 分 开 更 能 符合 


人 的 感知 。 


其 次 是 ,传统 记 音 中 , 将 15 调 与 55 调 合 并 为 


个 调 位 ， 认 为 是 由 于 发 声 类 型 不 同和 声 
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母 的 不 同 而 形成 的 音 位 互补 。 根 据 孔 江平 〈2001: 1880 给 出 的 嗓音 区 别 性 特征 矩阵 ， 载 瓦 
语 的 发 声 类 型 可 以 称 为 正常 嗓音 和 紧 嗓 音 ， 即 松 音 实际 上 是 正常 嗓音 。 根 据 孔 江平 〈2001: 
56)， 测 量 第 一 谐 波 Chl) 和 第 二 谐 波 Ch25 的 振幅 CB) 是 常用 的 嗓音 分 析 法 ， 其 谐 波 的 
振幅 差 一 般 能 反映 声带 振动 时 的 紧张 程度 ，h2-hl 数值 越 大 ， 声 带 越 紧 。 我 们 采用 谐 波 分 析 
法 选取 正常 嗓音 a 和 紧 嗓音 a 的 稳定 段 部 分 进行 分 析 ， 如 图 2 所 示 ， 确 实 存在 松紧 对 立 。 但 
是 从 调 值 上 来 看 ， 正 常 嗓音 的 实际 调 值 为 35， 与 55 的 调 值 差别 较 大 ， 本 文 认 为 不 能 将 二 者 
笼统 地 归 为 一 个 调 位 。 
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图 2: [aj-[a] 元 音 功 率 谱 
综 上 ， 从 基 频 模式 上 来 看 ， 本 文 认 为 载 瓦 语 应 有 6 个 声调 ， 其 中 2 个 平 调 ，1 个 升 调 ， 
3 个 降 调 ， 调 值 应 当 记 为 : 55，44, 35, 51, 31, 21。 
三 、 载 瓦 语 声调 感知 实验 
为 了 考察 基 频 及 发 声 类 型 对 声调 感知 的 影响 , 我 们 选取 了 3 组 载 瓦 语 单字 调 音节 作为 母 
本 进行 声调 感知 实验 ， 分 别 为 : /po21/“ 蛙 ”和 /po51/“ 便 宜 ” /121/ * ER" fI/151/ 398"; 
/mau35/“ 奇怪 ”和 /mau44/“ 骗 人 ”这 6 个 词 都 为 载 瓦 语 的 常用 词 。 其 中 ， 第 一 、 二 组 母 
本 声韵 母 相 同 ， 声 调 不 同 ， 韵 母 发 声 类 型 相同 ， 都 为 紧 嗓 音 或 都 为 正常 嗓音 。 第 三 组 母 本 声 
韵母 相同 ， 声 调 不 同 ， 且 韵母 发 声 类 型 不 同 ， 一 个 为 正常 嗓音 ， 一 个 为 紧 嗓 音 ， 即 本 组 样本 
同时 存在 基 频 和 发 声 类 型 的 对 立 。 原 始 音 节 由 一 位 男性 母语 者 发 音 ， 年 龄 20 岁 ， 母 语 为 载 
瓦 语 ， 四 个 音节 的 时 长 平均 500ms。 录 音 在 安静 的 室内 进行 ,具体 录音 设备 包括 : cool edit 
录音 软件 、 麦 克 风 (Sony)、 笔 记 本 电脑 (Thinkpad)、 外 置 声卡 和 调 音 台 。 录 音 时 的 采样 步 
率 为 22050Hz， 采 样 精度 为 16 位 。 
3. 1 实验 刺激 


本 文通 过 PSOLA (pitch synchronous overlap-add, 基 频 同步 天 加 ) 的 方法 对 上 述 3 


Iu 
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组 母 本 两 两 之 间 合 成 实验 刺激 。 以 “po21-po51” 组 为 例 : 首先 用 praat 脚本 程序 等 距离 地 
分 别提 取出 po21 和 po51 各 11 个 点 的 基 频 数据 , 接着 ,通过 插值 计算 出 这 两 个 声调 11 个 基 
频 测量 点 两 两 之 间 的 9 个 刺激 样本 的 基 频 ， 然 后 我 们 以 “po21” 作 为 母 本 ， 把 “po21” 的 原 
始 基 频 曲线 作为 组 内 第 一 个 刺激 样本 ， 接 着 逐步 按照 计算 出 的 9 个 样本 的 基 频 数值 来 改变 

“po21” 的 基 频 ， 均 匀 地 合成 9 个 连续 体 ， 最 后 按照 po51 的 实际 基 频 ， 在 “po21” 的 母 本 
上 合成 第 11 个 刺激 。 合 成 母 本 的 不 同 会 影响 被 试 对 刺激 的 感知 结果 ， 因 此 ， 我 们 随后 再 以 
“po51” 作 为 母 本 ， 同 样 通过 上 述 方 法 逐步 改变 基 频 得 到 11 个 刺激 样本 。 最 终 ， 我 们 合成 
f 3j, 62H, AH 11 个， 共计 66 个 刺激 样本 ,刺激 样本 的 基 频 曲线 图 如 图 3 所 示 。 


bo21-bo51 i21-i51 mau35-mau44 
140 


160 
150 
140 
130 
120 


110 SS 


100 100 110 
1234567282391011 1234567891011 1234567891011 


图 3: 三 组 声调 合成 样本 设计 

图 3 左 图 为 “po21-po51， 紧 嗓音 ”的 合成 样本 ， 基 频 最 低 为 108. 31 Hz， 最 高 为 160. 12 
Hz; 中 图 为 “i21-i51， 正 常 嗓音 ”的 合成 样本 ， 基 频 最 低 为 107. 41Hz， 最 高 为 162. 5 Hz; 
右 图 为 “mau35-mau44” 的 合成 样本 ， 发 声 类 型 对 立 ， 基 频 最 低 为 115. 69 Hz， 最 高 为 138. 49 
Hz。 

3. 2 实验 被 试 

本 文选 取 的 28 名 被 试 (12 B, 16 女 ) 均 来 自 德 宏 傣族 景颇 族 自治 州 瑞丽 市 户 育 乡 户 育 
村 尹 山 、 广 帕 、 芒 弄 、 户 育 四 个 村 民 小 组 ， 年 龄 16-52 岁 。 所 有 被 试 从 小 在 该 村 土生 土 长 ， 
以 载 瓦 语 为 母语 ， 平 时 与 家 人 、 朋 友 交 流 以 载 瓦 语 为 主 ， 听 力 和 视力 正常 ， 最 低 具 有 小 学 文 
化 水 平 。 

3. 3 实验 过 程 

每 个 被 试 都 参与 了 感知 实验 中 经 典 的 识别 和 区 分 任务 。 所 有 的 刺激 由 索尼 MDR-7506 H 
机 播放 出 来 , 双 声 道 , 72dB SPL. 实验 和 数据 采集 使 用 E-PRIME 软件 进行 。 在 正式 实验 之 前 ， 
被 试 可 以 进行 循环 练习 ， 以 熟悉 设备 与 实验 程序 。 在 正式 实验 中 ,被 试 可 随时 按 空格 键 暂停 
实验 进行 休息 。 

CD 识别 实验 

实验 将 合成 的 6 组 刺激 随机 播放 , 每 组 的 11 个 刺激 各 随机 出 现 2 次 (2*11=22trials)， 


135 
130 
125 


120 
115 


每 次 每 个 刺激 连续 播放 2 遍 。 声 音 播 放 的 同时 屏幕 上 会 同时 出 现 2 个 与 声音 对 应 的 载 瓦 文 词 
语 及 汉语 意思 ， 播 放 完毕 后 ， 选 择 为 强迫 式 的 二 选 一 形式 ， 被 试 必 须 在 5 秒 内 做 出 选择 ， 判 
断 他 听 到 的 是 哪个 词 。 

(2) 区 分 实验 

本 文采 用 了 AX 型 区 分 实验 .为 了 最 大 程度 上 区 分 范畴 内 和 范畴 间 的 不 同 (Pisoni，1973)， 
每 个 刺激 间隔 500 毫秒 成 对 出 现 , 被 试 有 5 秒 的 时 间 判 断 这 个 刺激 对 是 “< 相同 ”还 是 “不 同 ”。 
在 每 组 刺激 中 ， 不 同 对 中 的 两 个 刺激 间隔 两 个 步 长 ， 正 序 和 倒序 都 要 播放 。6 组 刺激 共 组 成 
了 18*649*6-162 个 样本 对 。 每 个 样本 对 在 实验 中 播放 2 次 ， 被 试 共 需 做 出 162*2=324 次 反 
应 ， 所 有 样本 对 的 播放 都 是 随机 的 。 

3.4 数据 分 析 

本 文 统计 了 每 个 被 试 的 识别 实验 结果 和 区 分 实验 结果 , 以 期 探讨 基 频 与 发 声 类 型 对 声调 
感知 的 贡献 , 确定 母语 者 对 不 同 声调 对 立 组 的 感知 模式 。 数 据 统计 分 析 采 用 Excel2010, IBM 


SPSS Statistics 20.0 及 R 语言 (The R Project for Statistical Computing, 一 种 统计 软件 ) 进行 。 
(1) 识别 函数 及 识别 边界 
每 个 刺激 的 识别 结果 是 被 试 将 其 识别 为 每 个 汉字 的 百分比 。 根据 识别 实验 数据 ， 本 文 构 


造 了 二 分 变量 逻辑 回归 模型 (Binary Logistic Regression)。 回 归 方 程 可 以 写 为 :loge(P1/1-P1) 


=b0+b1x (Xu et al,2006)。 对 每 一 组 声音 连续 体 ，P1 为 识别 实验 结果 ，x 为 声音 连续 体 的 步 
长 个 数 , b0 和 bl 是 回归 模型 函数 中 自 变 量 x 的 回归 系数 和 常数 ,bl 可 以 用 来 计算 回归 曲线 
的 斜率 , 识别 率 为 0.5 时 所 对 应 的 x 值 即 为 识别 边界 . 即 : b0+b1xcb= logeC0.5/1-0.5220—xcb- 


-b0/ bl1。 识 别 边界 宽度 为 识别 率 为 25% 和 识别 率 为 75% 之 间 的 线性 距离 (Xu et al, 2006). 
识别 边界 越 陡峭 ， 边 界 宽度 越 窗 ， 则 范畴 化 程度 越 高 ， 反 之 则 越 低 。 

(2) 区 分 实验 分 数 及 区 分 峰值 

本 文采 用 如 下 公式 计算 区 分 率 : P-P(*S"|S)*P(S)-P(^D"|D)*P(D) (Xu etal, 2006)。 其 
中 PC“S”|S) 为 相同 样本 对 被 判断 为 相同 的 概率 , PCD?|D) 为 不 同样 本 对 被 判断 为 不 同 的 概率 ， 
P(S) 和 了 PCD) 是 相同 和 不 同样 本 对 在 整个 区 分 实验 中 的 比例 ,本 次 实验 PCS) 和 了 PCD) 分 为 13 和 
2/3。 对 每 一 个 样本 对 处 得 到 的 区 分 率 数据 ， 需 要 判断 区 分 波峰 的 位 置 ， 所 以 本 文 会 通过 
One-way ANOVA 单 因 素 方差 分 析 和 Turkey HSD post-hoc 事后 检验 进行 两 两 比较 ， 确 定 哪 


个 或 哪 几 个 样本 对 的 区 分 率 显 著 高 于 其 他 样本 对 。( 张 文 彤 2004, 贾 俊 平 2006; FE 2016) 


! 两 两 比较 常见 的 统计 方法 有 LSD, Scheffe, Dunnett, Turekey 法 等 ， 其 中 Turkey's Honestly Significant 
Difference 是 在 各 组 样本 含量 相同 时 进行 两 两 比较 的 方法 ， 适 用 于 本 文 的 研究 。 
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3.5 实验 结果 
(1) i21-i51 声调 对 立 组 


i21-i51( 母 本 i21) i21-i51( 母 本 i51) 
100% 100% 
80% 80% 
60% 60% 
40% 40% 
20% 20% 
0% 0% 

1 2 3456 7 8 9 1011 1 2 3456 7 8 91011 
可 21 ei51 * 区 分 率 ei51 可 21 * 区 分 率 


图 4: i21-i51 声调 对 立 组 感知 结果 

图 4 左 图 是 母 本 为 i21 时 的 感知 结果 ， 统 计 得 出 ， 识 别 边界 和 识别 宽度 分 别 为 4. 22 和 
3. 04， 识 别 边 界 大 致 位 于 刺激 样本 中 间 位 置 ， 识 别 宽度 相对 陡峭 。 图 4 右 图 为 母 本 为 i51 
时 的 感知 结果 ， 统 计 得 出 ， 识 别 边界 和 识别 宽度 分 别 为 4 44 和 2. 99， 识 别 边界 大 致 位 于 刺 
激 样本 中 间 位 置 , 识别 宽度 相对 陡峭 。 两 组 感知 结果 的 识别 边界 基本 重合 .从 区 分 曲线 来 看 ， 
经 过 One-way ANOVA 单 因素 方差 分 析 和 Turkey HSD post-hoc 事后 检验 ， 如 表 1 所 示 ， 两 
图 中 9 个 样本 对 的 区 分 率 组 间 差 异 显著 (F(8, 243)= 5. 758, p=0. 000)，(F (8, 243) = 
4. 927, p-0. 000)，9 个 样本 对 的 区 分 率 两 两 比较 可 分 为 3 个 子 集 ， 子 集 内 部 各 样本 对 之 间 没 
有 显著 差异 ， 而 子 集 之 间 有 显著 差异 ， 但 表 中 可 以 看 出 ，3 组 子 集 相互 之 间 重 有 车 严重 ， 无 
法 判断 区 分 波峰 。 
表 1: i21-i51 声调 对 立 组 各 样本 对 区 分 率 的 同类 子 集 
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ET i51(i21) 区 分 率 统计 分 组 数据 ， 121-5151) PETS 


ZI" aum 0.05 ES 
zu EU 


o Ne alpha - 0.05 MF 0.05 的 子 集 中 


将 显示 同类 子 集中 的 组 均值 ， 将 显示 同类 子 集中 的 组 均值 ， 
a- 将 使 用 调和 均值 样本 大 小 = 28.000* ， a. 将 使 用 调和 均值 样本 大 小 = 28.000- ， 


(2) po21-po51 声调 对 立 组 


po21-po51( 母 本 po21) po21-po51( 母 本 po51) 
10096 10096 
80% 80% 
60% 60% 
40% 40% 
20% 20% 
0% 0% 
1234567891011 1234567891011 
apo21 epo51 * 区 分 率 epo51 spo21 * 区 分 率 


图 5: po21-po51 声调 对 立 组 感知 结果 


图 5 左 图 为 母 本 为 po21 时 的 感知 结果 ， 统 计 得 出 ， 识 别 边界 和 识别 宽度 分 别 为 6. 14 


和 2.79， 识 别 边 界 大 致 位 于 刺激 样本 中 间 侦 右 位置 ， 识 别 宽度 相对 陡峭 。 图 5 右 图 为 母 本 
信号 为 po51 时 的 感知 结果 ， 统 计 得 出 ， 识 别 边界 和 识别 宽度 分 别 为 4. 46 和 3. 91， 识 别 边 


界 也 大 致 位 于 刺激 样本 中 间 位 置 ， 识 别 宽度 相对 陡 赠 。 母 本 不 同 ,识别 边界 差异 不 大 。 从 


分 曲线 来 看 ， 左 图 被 试 9 个 样本 对 的 区 分 率 组 间 差 异 显著 CF (8, 243) = 3. 827, p=0. 000)， 但 


xl 


如 表 2 所 示 ， 两 两 比较 输出 为 3 个 子 集 ， 且 子 集 间 重 盖 严 重 ， 无 法 判断 区 分 波峰 。 右 图 被 试 


9 个 样本 对 的 区 分 率 组 间 差 异 不 显著 (F (8, 243)= 1. 574, p=0. 133)， 不 存在 区 分 波峰 。 


表 2: po21-po51 (po21)\ mau35-mau44 (mau35) 声调 对 立 组 各 样本 对 区 分 率 的 同类 子 集 


201811.00126v1 


chinaXiv 


mig (po21) 区 分 率 统 计 分 组 数据 ， nau35-nau44 (mau35) 区 分 率 统计 分 组 ， 


— UM P F5 5 orm Fm je De 


将 显示 同类 子 集中 的 组 均值 ， 将 显示 同类 子 集中 的 组 均值 * ， 
a. 将 使 用 调和 均值 样本 大 小 = 28.000。， a. 将 使 用 调和 均值 样本 大 小 = 28.000* ， 


(3) mau35-mau44 声调 对 立 组 


mau35-mau55 〈 母 本 mau35) mau35-mau44( 母 本 mau44) 
10096 10096 
8096 8096 
6096 6096 
4096 4096 
2096 2096 
096 096 
12 34567 89 1011 1234567 891011 
smau35 emau55 «[X 4) 3€ emau55 smau35 < 区 分 率 


图 6: mau35-mau44 声调 对 立 组 感知 结果 

图 6 左 图 为 母 本 为 mau35 时 的 感知 结果 。 统 计 得 出 ， 识 别 边界 和 识别 宽度 分 别 为 10. 21 
和 5. 86， 识 别 边界 非常 平缓 ， 几 乎 靠近 最 后 一 个 刺激 样本 ， 识 别 宽度 也 较 宽 。 图 中 还 可 看 
出 ， 被 试 对 第 一 个 刺激 样本 ， 将 其 识别 为 mau35 的 比率 几乎 为 100%， 识 别 为 mau44 的 比率 
几乎 为 0%。 但 随 着 刺激 样本 基 频 从 35 变化 到 44， 虽 然 被 试 对 mau35 的 识别 率 不 断 下 降 , 但 
始终 没有 降 为 0%， 对 mau44 的 识别 率 不 断 上 升 ， 但 也 始终 没有 升 为 100%， 在 第 10 和 第 11 
个 刺激 样本 处 ， 对 mau35 和 mau44 的 识别 率 几 乎 各 为 50%。 

图 6 右 图 为 母 本 为 mau44 时 的 感知 结果 。 统计 得 出 , 识别 边界 和 识别 宽度 分 别 为 4. 82、 

3. 04。 识 别 边界 大 致 位 于 刺激 样本 中 间 位 置 。 与 左 图 对 比 ， 被 试 的 感知 结果 差异 显著 ， 识 别 
宽度 相 比 左 图 要 窗 的 多 , 即 范畴 边界 较为 陡峭 ,被 试 对 mau35 的 识别 率 从 100% 逐 渐 降 至 0%, 


对 mau55 的 识别 率 从 0% 逐 渐 升 至 100%。 
从 两 组 实验 的 区 分 曲线 来 看 ， 左 图 被 试 9 个 样本 对 的 区 分 率 组 间 差 异 显 著 〈F(8, 243) = 


3. 537, p=0. 001)， 但 两 两 比较 输出 为 3 个 子 集 ， 如 表 2 所 示 ， 子 集 间 重 车 严重 ,无 法 判断 区 
分 波峰 。 右 图 被 试 9 个 样本 对 的 区 分 率 组 间 差 异 不 显著 (F(8, 243)= 2. 250, p=0. 025). 


3.6 讨论 

实验 结果 显示 ,“i21-i51” 和 “po21-po51” 这 两 组 声调 对 立 组 的 感知 实验 ， 识 别 边界 
均 较 为 陡峭 ， 高 降 调 与 低 降 调 能 够 被 明显 地 区 分 为 两 个 对 立 的 音 位 范畴 。 即 在 范畴 内 部 无 论 
基 频 如 何 变化 , 都 只 能 被 感知 为 同一 个 声调 , 一 旦 变化 跨越 范畴 边界 就 被 感知 为 另 一 个 声调 。 
在 每 组 声调 对 立 内 部 ， 由 不 同 母 本 合成 的 实验 刺激 ,感知 结果 的 识别 边界 也 差异 不 大 。 这 说 
明 在 语言 学 意义 上 , 主要 是 基 频 对 区 分 这 两 组 声调 起 了 作用 。 此 外 ,从 感知 模式 上 来 看 “ 识 
别 曲线 边界 分 明 、 区 分 曲线 存在 波峰 且 与 识别 边界 对 应 ”是 被 大 多 数学 者 所 认同 的 2 项 范畴 
感知 判断 标准 , 这 两 组 感知 实验 的 结果 虽然 识别 曲线 边界 分 明 , 但 区 分 曲线 在 统计 结果 上 并 
未 出 现 波峰 ， 因 此 在 行为 学 上 的 感知 模式 为 连续 感知 。 前 文 提 到 ， 前 人 研究 大 多 认为 ， 母 语 
者 对 调 型 相同 , 调 值 不 同 的 声调 对 立 感知 为 连续 感知 , 调 型 相同 指 的 是 声调 曲线 斜率 应 当 一 
致 ， 例 如 31 调和 53 调 ， 而 对 调 型 和 调 值 均 不 同 的 声调 对 立 感知 为 范畴 感知 。 本 文 实验 中 ， 


虽然 21 调和 51 调 都 为 降 调 , 但 是 斜率 差别 较 大 , 也 就 是 说 既 有 调 型 的 差别 也 有 调 值 的 差别 ， 

但 母语 者 对 本 组 声调 对 立 的 感知 却 不 是 范畴 感知 , 这 与 前 人 研究 有 出 入 , 具体 原因 仍 待 进 一 
[= 此 外 ,更 有 意思 的 是 ,第 三 组 mau35-mau44 声调 对 立 的 感知 ， 当 母 本 不 同时 ， 母 语 者 的 
感知 结果 出 现 了 显著 的 差异 。 


图 6 左 图 ， 当 刺激 的 母 本 为 正常 嗓音 时 ， 识 别 边界 非常 平缓 ， 被 试 几乎 不 能 将 
mau35-mau44 区 分 为 两 个 音 位 范畴 。 造 成 这 种 现象 的 原因 是 什么 呢 ? 首先 ， 由 于 母 本 为 正常 
嗓音 ， 那 么 即使 基 频 从 35 变化 到 了 44， 在 嗓音 性 质 不 改变 为 紧 嗓音 的 情况 下 ， 仪 赁 基 频 的 
变化 ， 被 试 无 法 将 刺激 样本 识别 成 mau44。 其 次 结合 载 岂 语 的 音 系 来 看 ， 虽 然 mau44 这 个 音 
节 不 存在 , 但 “声母 (送气 或 清 擦 音 ) + 正常 嗓音 + 高 平 调 44” 这 种 音节 组 合 方式 是 存在 的 ， 
如 表 4 所 示 的 /khau44/“ 表 兄弟 ” 那么 当 母 本 为 正常 嗓音 时 , 被 试 会 对 越 来 越 趋 向 于 mau44 
的 刺激 样本 感到 疑惑 , 从 而 与 mau44 产生 混 消 , 所 以 也 不 会 将 其 完全 识别 成 mau35, 对 mau44 
和 mau35 的 识别 率 都 在 50% 左 右 。 也 就 是 说 ， 由 于 母 本 缺失 了 发 声 类 型 ， 基 频 在 这 里 对 感知 
实际 上 并 没有 起 到 作用 ， 被 试 出 现 了 基 频 的 “感知 中 立 ” 

表 4: 载 瓦 语 高 平 调 与 高 升 调 声韵 母 配 合 情 况 


声母 DRAR RERE) 


章 母 正常 嗓 
声调 44 
例 字 /khau/ 表 兄弟 
图 6 AR, 
显 的 音 位 范畴 。 基 频 逐 步 变 化 为 44 时 ， 被 试 
别 出 了 mau44。 
音节 组 合 形式 ， 各 了 发 声 类 型 的 噶 ， 
显示 ， 基 频 和 发 声 类 型 共同 对 紧 嗓 音声 调 上 
发 声 类 型 对 ] 的 识别 失去 了 作 月 


综 上 ， 本 组 实验 结果 从 感知 的 角度 ， 训 


基 频 和 发 声 类 型 


B 


清 擦 音 / 送 气 音 


所 有 声母 REZAN 所 有 声母 
KIRE 正常 嗓音 + 塞 尾 。 紧 嗓音 + 塞 尾 


44 55 55 


/mau/ 骗 人 / f ut/ 错 /tsut/ 肺 
当 刺 激 的 母 本 为 紧 嗓 音 时 , 识别 曲线 边界 分 明 ， 两 个 声调 被 区 分 为 了 两 个 明 


过 “ 基 频 ”+“ 紧 嗓音 “这 两 条 特征 


J 在 3 
iH 楚 识 


~ 


基 频 趋向 35 时 ， 由 于 载 瓦 语音 系 中 不 存在 “韵母 为 紧 嗓音 + 声调 为 35” 这 和 有 


仅 赁 基 频 即将 其 识别 为 mau35。 这 组 实验 结果 
的 感知 结果 起 到 了 重要 作用 。 但 由 于 音 位 的 互补 ， 
H 被 试 将 发 声 类 型 为 紧 嗓音 的 刺激 识别 为 了 正常 嗓音 
， 昌 然 该 组 感知 结果 识别 | 


组 声调 对 立 在 行为 学 意义 上 的 感知 模式 


| 线 较为 陡峭 , 但 由 于 无 法 判断 区 分 波峰 ， 被 试 对 本 
仍 为 连续 感知 。 


FE 特征 ， 


本 文 首先 
31、21) 和 1 个 升 调 (35)。 然 后 ， 重 点 古 


E 明 了 载 瓦 语 高 平 调和 高 升 调 这 两 个 音 位 之 间 , 存 
< 同 对 声调 感知 起 着 重要 作用 。 


通过 声学 分 析 确 定 了 载 瓦 语 6 个 声调 的 调 值 :2 个 平 调 (55、44)、3 个 降 调 (51、 


完了 被 试 对 高 平 调 44 和 高 升 调 35、 低 降 调 21 和 


高 降 调 51 的 感知 。 结 果 表明 : 载 瓦 语 母语 者 对 声调 不 同 、 发 声 类 型 相同 的 声调 对 立 组 为 连 
续 感知 ; 声调 和 发 声 类 型 都 不 同 的 声调 对 立 组 ， 当 合成 母 本 为 紧 嗓音 , 被 试 为 连续 感知 ， 当 
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[Abstract] Zaiwa language which is used by Zaiwa branch of Jingpo ethnic group is part of 
Sino-Tibetan language family. According to our acoustic and perceptual studies, Zaiwa language 
has six tones for monosyllabic words: two level tones, three falling tones and one rising tone. 

Their tone values are: 55, 44, 35, 51, 31, 21.This paper therefore undertook a perceptual 
experiment on three type combinations of tones and phonation:1)different tones, both modal voice; 
2) different tones, both pressed voice; 3) different tones, modal voice Vs. pressed voice. The result 
turned out that both fundamental frequency (FO) and phonation contribute to the perception of 
tones in Zaiwa language and the lack of phonation will lead to the “FO neutral perception" 


phenomenon. 


[Keywords] Zaiwa language phonation acoustic analysis tone perception 
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